R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística
Percy Soto-Becerra M.D., M.Sc(c)
InkaStats Data Science Solutions | Medical Branch
@github/psotob91
Agosto 06, 2022
¡Hola Mundo!
Percy Soto-Becerra, M.D., M.Sc(c)
La Ciencia de Datos es una disciplina que se dedica al estudio y aplicación de técnicas diversas (estadística, informática, etc.) para convertir datos crudos en información y conocimiento.
En este curso aprenderemos a hacer esto de manera ordenada.
Este es un curso introductorio con énfasis en pensamiento estadístico.
Ciencia de Datos en Salud (Health Data Science en inglés) es la ciencia y el arte de generar soluciones basadas en datos a través de la comprensión de problemas de salud complejos del mundo real, empleando el pensamiento crítico y el análisis para derivar conocimiento de los (grandes) datos.1
¿Qué significa que un análisis de datos es “reproducible”?
A corto plazo:
¿Las tablas y figuras se pueden reproducir del código y datos?
¿El código realmenet hace lo que quieres que haga?
¿Es claro por qué el código hace lo que hace?
A largo plazo:
¿Puede el código ser usado con otros datos?
¿Puedes extender el código a otros usos?
Flujo de trabajo reproducible
Scriptabilidad R
Programación literaria (código, narrativa, salida en un solo lugar) RMarkdown y Quarto
Versión de control Git / Github
En este curso nos enfocaremos en Scriptabilidad y Programación literaria.
P - ¿Qué nivel previo de ciencia de datos asume este curso?R - Ninguno.
P - ¿Es este un curso introductorio de Estadística?R - Aunque estadística \(\neq\) ciencia de datos, están muy relacionados y existe enorme sobrelapamiento. Este curso es una buena forma de aprender Estadística, sin embargo, no es un curso típico de un programa formal de Estadística.
P - ¿Haremos computación?R - Sí.
P - ¿Este es un curso introductorio de programación?R - No.
P - ¿Qué lenguaje aprenderemos?R- R.
P - ¿Por qué no otro lenguaje?R- Lo discutiremos en su momento ☕.
Teorías y código práctico completamente asincrónico.
Componente sincrónico opcional:
Martes o jueves de 7 pm a 8 pm.Todo el contenido será subido a la web del curso: https://rcds3.inkastats.es/
La web así como todos los slides tienen derechos de autor y licencia .
Siempre y cuando sea para fines no comerciales, ustedes pueden…
Pueden reutilizar los slides y compartirlos (¡son libres en la web!).
También el código fuente que los genera (lo puedes encontrar aquí).
En todos los casos, deben citer la fuente.
Sin embargo, los videos cuentan con una contraseña que les has sido proporcionada previamente:
¡No compartir la contraseña!7 problem sets opcionales.
Son requeridos para constancia de aprobado.
Si no se resuelven, solo tendrán constancia de participación.
Se colgarán en siguiente enlace: https://rcds3.inkastats.es/assignment/
Constancia de aprobado
Cuando el participante haya aprobado satisfactoriamente con nota mínima 14 (catorce) el curso.
Solo necesita resolver los problem sets y subirlos al enlace que se habilitará para tal fin: https://rcds3.inkastats.es/assignment/
Constancia de participación
Cuando no tenga nota aprobatoria habiendo cumplido con las actividades programadas según lo establecido en el syllabus.
¡Solo debe conectarse y ver las videoclases en tiempo asincrónico!
Introducción a R y RStudio